Неудача точности
Хотя полином высокой степени может проходить через каждую точку данных, он часто приводит к «рунковским» колебаниям. Эти резкие колебания не имеют ничего общего с физическим процессом. Поэтому неразумно требовать, чтобы аппроксимирующая функция точно совпадала с данными, особенно когда измерения подвержены вариации.
Определение «лучшего» соответствия: три нормы
Для приближения мы должны определить функцию ошибки $E$. Как мы измеряем «близость», полностью меняет результат:
Пытаясь минимизировать максимальную возможную ошибку:
$$E_{\infty}(a_0, a_1) = \max_{1 \le i \le n} \{|y_i - (a_1 x_i + a_0)|\}$$
Недостаток: Подход минимакса обычно придает слишком большое значение части данных, которые сильно отклоняются.
Сумма абсолютных разностей:
$$E_1(a_0, a_1) = \sum_{i=1}^{n} |y_i - (a_1 x_i + a_0)|$$
Недостаток: Функция абсолютного значения не дифференцируема в нуле, и мы можем не найти аналитических решений для этой пары уравнений.
Стандарт в численном анализе, квадратирование остатков:
$$E_2(a_0, a_1) = \sum_{i=1}^{n} [y_i - (a_1 x_i + a_0)]^2$$
Это создает гладкую, дифференцируемую поверхность, где с помощью исчисления легко найти глобальный минимум.
Аналитические ограничения
Выбор метрики — это баланс логики и исчисления. Например, метод абсолютного отклонения не уделяет достаточного веса точке, которая значительно отклоняется от аппроксимации, в то время как $L_2$ обеспечивает надежный компромисс, который штрафует большие выбросы, не позволяя одному случайному значению доминировать над всей аппроксимацией.